민추 발표 논문

1995. 12. 『民族文化』18, 민족문화추진회

韓國古典籍 전산화의 성과와 과제

- 《조선왕조실록 CD-ROM》 개발 사업의 경과와 발전 방향 -

김 현

서울시스템주식회사 상무이사

   1. 《국역 조선왕조실록 CD-ROM》 개발 과정

   2. 조선왕조실록 데이터베이스의 발전 방향

   3. 조선왕조실록 데이터베이스의 개발 의의

   4. 고전 자료 전산화 추진에 관한 제언

서울시스템주식회사의 한국학데이터베이스연구소에서는 지난 1995년 10월 《국역 조선왕조실록》 데이터베이스를 CD-ROM 판으로 간행하였다. 이 데이터베이스는 세종대왕기념사업회와 민족문화추진회에서 1968년부터 1993년까지 26년간 번역한 《국역 조선왕조실록》의 본문과 역주를 기본 텍스트로 삼고, 여기에 전체 개별 기사의 요지 및 국사편찬위원회에서 편수한 태조에서 성종까지의 기사 분류 색인을 추록한 것이다. 이 데이터베이스에서는 《조선왕조실록》의 모든 기사를 일자별(日字別), 분류별(分類別) 색인을 통해 탐색될 수 있도록 하였으며, 본문 속의 모든 한글 한자(漢字) 단어에 대한 조건 검색 기능도 부여하였다. 《세종실록》｢오례(五禮)｣ 부분에 수록된 500 종의 도식과 삽도 또한 정밀하게 가공 입력하여 멀티미디어 데이터베이스의 면모를 갖추었으며, 본문 속의 모든 동일 단어와 어구는 서로 연계하여 참조할 수 있도록 하였다. 검색된 자료의 2차적인 활용의 편의를 증진시키기 위해서 검색 결과의 출력 및 화일 저장 그리고 다른 응용 프로그램으로의 이동 복사 기능을 구현하였다.

이번에 출간된 《국역 조선왕조실록 CD-ROM》은 《조선왕조실록》이라는 하나의 문헌을 전산화했다는 의미뿐 아니라 고전 자료의 전산화라는 새로운 사업 영역의 모델을 제시했다는 의미를 함께 지닌다. ‘조선왕조실록 전산화’의 내용은 바로 우리 사회에 구축된 고전 자료 전산 처리 능력의 현주소를 말해 주는 것이라고 보아도 무방할 것이다. 필자는 이 글을 통해 그 동안 진행되어 온 조선왕조실록의 전산화 과정을 밝힘으로써 우리나라의 고전 자료 전산화의 현황을 알리고 이어서 현재까지 이루어진 전산화 사업의 성과들이 앞으로 발전해 가야할 방향에 대해 필자의 의견을 개진코자 한다.

1. 《국역 조선왕조실록 CD-ROM》 개발 과정

《조선왕조실록》은 조선왕조의 개조인 태조로부터 25대 철종까지 472년간의 조선조 정치 경제 사회 문화의 모든 분야를 상세히 기록한 역사서로서 우리의 전통문화를 연구함에 있어 결코 배제할 수 없는 소중한 사료이다. 하지만 그와 같은 중요성에도 불구하고 《조선왕조실록》은 누구나 쉽게 접근하여 이용할 수 있는 문헌이 아니었다. 그 일차적인 요인은 원문이 난해한 한문으로 되어 있다는 점이었지만, 이 문제는 민족문화추진회와 세종대왕기념사업회 두 기관을 중심으로 이루어진 국역 사업에 의해서 해소되었다고 할 수 있다. 그럼에도 불구하고 《조선왕조실록》의 활용이 여전히 미진할 수밖에 없었던 이유는 그 문헌의 방대한 양에 있다고 여겨진다. 책수로 413권, 문자 수는 2억자에 육박하는 그 문헌에서 특정 내용의 기사를 찾아내는 것은 전문 역사 연구자에게도 쉬운 일이 아니다. 더구나 실록은 그 날 그 날 일어난 일들을 날짜에 따라 기록하는 서술 방식을 취하고 있기 때문에 한 사건의 본말을 모두 살피기 위해서는 짧게는 몇 개월에서 길게는 몇 십 년 치의 기사를 통독해야만 한다. 따라서 이러한 《조선왕조실록》에서 어떤 구체적인 사전(事前) 정보 없이 원하는 자료를 찾아내는 것은 불가능할 일일 수밖에 없었다. 소수의 전문 연구자들만이 자신의 전공에 해당되는 연대의 기사를 몇 년 동안 읽어가면서 일일이 카드로 작성하고, 그것을 부분 부분 활용하는 것이 현재까지의 《조선왕조실록》 활용 형태였다.

아무리 소중한 문화유산이라 할지라도 그것이 단지 역사의 유물로 남아 있을 때의 의미와 현대 사회의 각 분야에서 생명력 있게 쓰여질 때의 의미는 전연 다를 것이다. 《조선왕조실록》이 그 엄청난 노력으로 현대어화 되었음에도 불구하고 그것을 활용하는 길이 소수의 전문 연구자들에게만 열려 있는 한, 대다수의 사람들에게 있어서 《조선왕조실록》은 한낮 역사가 남긴 유물에 불과한 것이다.

《조선왕조실록》을 고리타분한 유물에 머물지 않게 하고 그것이 현대 사회의 학술, 교육, 문화 등 여러 분야에서 그 소중한 가치가 발휘될 수 있게 하는 최선의 방법은 그것을 전산화하는 것이라는 의견은 이미 오래전부터 거론되어 온 바였지만, 그것을 실현시킬 현실적인 방안을 찾는 것은 용이한 일이 아니었다. 《조선왕조실록》은 고전 자료라는 질적 특수성과 그 방대한 양적 규모로 인해 전산 자료를 다루는 일반적인 기술로는 문제를 올바로 해결할 수 없으며, 고도의 전문적인 기술력을 토대로 전적으로 새로운 전산 시스템을 개발하는 노력이 선행되어야만 했기 때문이다.

《조선왕조실록 CD-ROM》의 개발 사업은 1992년 가을 서울시스템주식회사에서 데이터베이스 개발실을 설립하면서 본격적으로 추진되기 시작하였다. 그러나 그 준비 작업의 시작은 그보다 수년 전으로 소급되는데, 고전 자료의 전산화를 위한 문자 코드와 서체 개발 사업의 시작이 이 개발 사업의 가장 기본적인 토대가 된 것이다. 컴퓨터에 대한 이해가 깊지 않은 일반인들은 ‘문자’를 기계적으로 입력해 넣기만하면 전산화가 이루어지는 것으로 잘못 이해하고 있는 경우가 많다. 아마도 개발이 완료된 《국역 조선왕조실록 CD-ROM》의 실물을 보고서도 이 제품이 만들어진 과정을 그 정도로만 이해하는 분들도 적지 않을 것이다. 그러나 문자 데이타의 입력 작업은 데이터베이스를 구축하는 전 공정에서 일부분을 차지할 뿐이다. 데이타 입력을 전후에서 이루어져야 하는 많은 일들 가운데 첫번째 과제는 대상 데이타가 컴퓨터 내에서 모두 부호화될 수 있도록 코드 체제를 정하고 그에 상응하는 서체를 개발하는 일이다. 이것은 인쇄를 위해 활자를 만드는 일과는 전혀 다른 차원의 일이다. 문자 코드는 전산화의 결과물이 통용될 사회 내지 문화권 전반에 걸친 공동의 약속이어야 한다. 당연히 그것은 국가적, 혹은 세계적인 표준으로 정착되어 있어야 하는 것이다. 그러나 우리나라에서는 유감스럽게도 이 표준적인 약속의 규모와 범위가 너무 취약하여 일반 사무용 문서를 처리하는 일 이상을 하기 어려운 실정이었기 때문에 《조선왕조실록》과 같은 고전 자료를 전산화기 위해서는 보다 확장된 새로운 부호계가 필요하였다.

서울시스템에서 국학자료를 전산화할 수 있는 포괄적인 한자 부호계 제정 작업을 1988년부터 시작하였다. 물론 이 작업은 《조선왕조실록》의 전산화만을 목표로 했던 것은 아니고, 당시 서울시스템에서 진행하고 있던 한문사전 편찬 시스템의 개발 및 족보․문집과 같은 한적 출판 시스템의 개발에 모두 적용하기 위한 것이었다. 이 사업을 추진한 결과 서울시스템 서체개발실은 단일 서체에 대해 7만자 이상의 한자와 그에 상응하는 자체 부호계를 보유하게 되었다. 1992년에 데이터베이스 개발실이 설립된 이후에는 이 문자 부호계가 출판용에 머물지 않고 정보 시스템 구축에도 쓰일 수 있도록 보완하는 작업이 추진되었다. 국학자료 데이터베이스 구축에 긴요한 문자들을 엄밀하게 조사하여 그 규모를 1만7천 자 수준으로 축소 조정하였고, 그것에 2바이트 체제의 문자 코드를 부여하였으며, 코드화된 모든 문자에 대해서는 정밀한 속성 정보와 한․중․일(韓中日) 3국간의 자료 호환에 필요한 코드 변환 정보를 조사하여 부기하였다. 코드 제정 작업과 아울러 서체 개발 작업이 병행되었음은 물론이다. 컴퓨터 시스템의 비약적인 발전과 더불어 서체 개발 분야에도 첨단 기술이 도입 적용되어야 했다. 화면에서뿐 아니라 고해상도의 출력물 상에서도 미려한 문자 형태를 유지하는 다종의 윤곽선 서체가 수십 차례의 검증과 수정을 거쳐 완성되었다.

문자 부호계 제정과 서체 개발의 토대 위에서 이루어진 다음 단계의 개발 과제는 데이터베이스에 수록될 정보를 입력하는 소프트웨어의 개발이었다. 이를 위해서 서울시스템에서는 10년 전부터 축적해 온 문서 편집기 개발 기술을 토대로 문자 데이타 입력을 위한 전문 편집기를 개발하였다. DTP 사업부에서 개발을 주도한 이 문서편집기의 특징은 국학자료 처리를 위한 17,367자의 한자 코드와 서체를 를 모두 수용하고, 여기에 ‘뿌리법’이라고 하는 고속 한자 입력 방식을 탑재한 것이다. 뿌리법은 한자를 독음이 아닌 형태적 요소에 따라 입력할 수 있도록 한 것으로 한적 자료 및 한자가 많이 쓰여진 국역 자료를 능률적으로 입력할 수 있도록 한 장치이다.

《조선왕조실록》 데이터베이스의 개발을 가능케 한 또 하나의 요소는 정보 검색 소프트웨어의 개발이었다. 이 분야에서는 한문 및 국역문에 가장 적합한 데이터베이스 구조 및 색인어 추출 방법, 방대한 어휘로 이루어진 색인 화일에서 검색 어휘를 최단시간에 찾아 내는 방법, 컴퓨터 메모리의 제약을 최소화하는 연산 알고리즘을 구현하는 것 등이 주된 연구 과제가 되었다.

이상과 같은 요소 기술의 개발과 더불어 조선왕조실록 데이터베이스 구축 사업이 1992년 가을부터 착수되게 되었다. 서울시스템에서 정보 시스템 사업을 활성화하기 위해 설립한 데이터베이스사업부는 대형 문자 정보 데이터베이스 개발의 첫번째 과제로 ‘조선왕조실록 데이터베이스 사업’을 기획하였다. 조선왕조실록 데이터베이스 사업의 범위는 국역문은 물론 한문 원전까지를 포함하는 것으로 하였으며, 사업의 완료 시기는 5년 후인 1997년으로 예정하였다. 이후 1993년 가을까지 약 1년 동안은 트루타입 폰트, 뿌리법, 풀 텍스트 검색 프로그램 등 요소 기술을 안정화시키는 일에 병행하여 실록 데이터베이스 구축을 위한 자료 구조 설계 및 실록 데이타의 입력에 의한 시험 데이터베이스 구축 업무가 진행되었다.

1993년 10월부터는 태조에서 태종까지의 실록 기사를 담은 시험 데이터베이스가 연구실 내에서 운영되었고, 이를 토대로 전체 데이터베이스를 구축에 적용할 최종적인 자료 구조가 확정되었다. 이어서 한문 원전과 국역문 두 부문의 자료 입력센터를 설치하여 자료 입력 업무를 본격적으로 시행하였다.

이상의 과정을 통해 서울시스템은 조선왕조실록 데이터베이스 구축 및 CD-ROM 간행에 필요한 요소 기술을 모두 구비하였으나 데이터베이스를 실제로 만들기 위해서는 원천 자료 저작자와의 합의가 필요했으므로 《조선왕조실록》의 국역 업무를 수행한 세종대왕기념사업회 및 민족문화추진회와 더불어 이 사안에 대한 협의를 진행하였다. 데이터베이스나 CD-ROM에 대한 일반인의 인식도가 높지 않은 당시로서는 이 문제에 대한 합의 도출에 어려움도 있었으나, 이는 두 국역 기관의 소속 부처인 문화체육부와 교육부 관계자들의 적극적인 중재 노력에 힘입어 해결되게 되었다.

1994년 4월 문화체육부 차관을 위원장으로 하는 ‘조선왕조실록 CD-ROM 간행위원회’가 조직되어 《조선왕조실록 CD-ROM》 간행 사업을 문화체육부 및 교육부에서 주관하는 체제를 갖추었다. 간행위원회에서는 서울시스템이 진행해 온 두 종류(한문 및 국역)의 《조선왕조실록 CD-ROM》 개발 사업 중 보다 광범위한 수요층이 있는 국역 실록 CD-ROM을 먼저 개발하고, 이어서 한문 원전 실록 CD-ROM을 개발한다는 원칙을 세우고 이러한 계획을 언론에 공표하였다.

문화체육부와 교육부가 《조선왕조실록 CD-ROM》 개발 사업의 주관 기관이 됨으로써 국역기관과 개발기관의 협조 체제도 더욱 공고해져 이 사업은 급속히 진전될 수 있었다. 그러나 이들 두 부처가 담당한 역할은 관계 기관들 사이의 의견 조율과 행정 지원이었을 뿐, 이 사업에 국가 예산을 지원하는 것은 아니었다. 사업을 완료하기까지의 모든 인적 물적 투자의 부담은 여전히 서울시스템 혼자의 몫으로 남게 되었다.

《조선왕조실록 CD-ROM》 개발 사업이 공식화되자 서울시스템에서는 이 사업의 전담 조직으로서 ‘한국학데이터베이스연구소’를 설치하였다. 데이터베이스, 전자출판, 서체, 코드, 그래픽 유저 인터페이스 등 서울시스템이 키워 온 모든 기술력이 이곳에 집중되었으며, 그것을 《조선왕조실록》이라고 하는 고전 자료와 접목시키는 코디네이터 역할은 12명의 인문학 분야 상임연구원들이 담당하였다.

한국사 및 한문학 연구자들로 구성된 인문 분야 연구원들이 맡은 가장 큰 임무는 원천 데이타의 입력과 교정 및 기사 요지 집필의 업무를 총괄하는 일이었다. 서울시스템의 논현동 본사와 평창동 서체개발연구소 및 충무로 영업본부 3 곳에 입력센터가 설치되어 자료 입력 작업을 진행하였을 뿐 아니라, 부산, 대구, 광주, 대전 등 서울시스템의 입력 장비가 보급된 지방 지사에도 입력센터를 설치하여 업무를 분담하였다. 남한에서 번역한 실록 국역문은 북한본과는 달리 한자의 비중이 높고 또 갖은 벽자들이 쓰여졌기 때문에 모든 입력 작업은 100% 서울시스템이 자체 개발한 데이타 편집기로 이루어질 수밖에 없었다.

데이터베이스 개발 사업의 성패 여부는 시스템의 기능보다도 자료의 정밀성에 의해 좌우되는 것이다. 따라서 입력된 자료는 가능한 한 엄밀한 교정 과정을 거치도록 하였다. 교정은 국역 실록 전문에 대해서 5교를 시행하였다. 이것은 물론 충분한 회수라고는 할 수 없다. 하지만 이 5교의 교정을 위해 출력한 교정지 (A4 사이즈)의 매수가 100만 매를 넘었다고 하는 사실은 이 교정 업무가 얼마나 엄청난 일이었는지를 알게 해 준다. 이 교정 실무는 전국의 대학 사학과 석박사 과정에 있는 분들께 위촉하여 진행하였는데, 교정 담당자의 수도 200 명이 넘는 인원이었다.

이 과정에서 본 연구소의 연구원들이 수행한 일 중의 하나는 국역 실록의 용어 및 체제 정리 지침을 마련하여 그 내용을 교정자들에 교육시키는 일이었다. 실록의 국역은 두 기관에서 분담하여 수행했기 때문에 두 기관의 번역문 사이에는 용어 사용이나 체제에 있어서 상이점이 적지 않았고, 또 워낙 오랜 기간 동안 여러 사람들에 의해 이루어진 일이라서 한 기관의 번역물 내에서도 차이나는 부분들이 있었다. 또 하나 중요한 사실은 전산 데이타는 어디까지나 정보 검색을 전제로 해서 만들어지는 것인 만큼 용어의 표기 원칙도 이 점을 고려해야 한다고 하는 것이다. 서울시스템의 연구진들이 마련한 표기 및 체제 통일 지침 시안은 두 국역기관과의 협의를 거쳐 입력 및 교정 업무에 반영되었다.

본 연구소의 연구원들과 교정 담당자들이 해 낸 또하나의 업무는 실록의 모든 기사에 대해 기사 요지문을 작성한 것이었다. 이 부담스런 일을 데이터베이스 개발자가 과연 맡아야 하는가에 하는 이견도 만만치 않았지만, 나중에 이 데이터베이스를 이용할 이용자들의 편의를 생각하면 생략할 수 없는 일이었다. 실록의 기사 중 짧은 것은 한 줄에 못미치는 것도 있지만 긴 것은 원고지 수백 매 분량인 것도 있다. 사용자가 데이터베이스 상에서 자료를 검색해서 얻은 결과가 몇 십 건이 나 몇 백 건에 이른다고 했을 때, 그 가운데 어느 기사가 과연 자기가 찾는 내용인지를 확인하기 위해 검색된 기사를 일일이 읽어야 한다면 그 부담도 만만치 않을 것이다. 이용자가 검색된 기사의 내용을 한 눈에 식별하여 취사 선택할 수 있도록 하기 위해 작성된 기사 요지문의 총분량은 문자 수로 1천7백만 자, 300 페이지짜리 책 50 권에 이르는 분량이다.

국역 실록의 본문 입력 작업은 1995년 3월 말에 완료되었고 교정 및 기사 요지 작성 작업은 그보다 3개월 늦은 6월 말에 완료되었다. 데이터베이스에 입력된 실록의 기사의 수는 총 362,161 건, 그 속에 쓰여진 문자는 모두 1억9천8백만 자에 달하는 것으로 조사되었다. 이것은 본문 이외에도 362,161 건의 기사 제목에 쓰인 1천7백만 자와 162,954개 항목의 역주에 쓰인 8백3십만 자를 포함한 값이며, 순수하게 국역 실록 본문에만 쓰인 글자는 1억7천2백만자이다.

이 본문 속의 단어는 풀 텍스트 검색을 할 수 있도록 모두 색인화 되었는데, 색인 생성을 위해 추출된 어절의 수는 4천1백만 개였다. 여기에 덧붙여 단어 검색시 검색율을 높이기 위해 본문 어휘 중 2 글자가 넘는 어절은 모두 1 자 단위로 절단하여 색인을 생성한 결과, 색인 어휘의 총 수는 7천4백만 개가 되었다.

조선왕조실록 데이터베이스는 원래 풀 텍스트 인덱싱에 의한 자연어 색인만을 제공하는 것으로 계획되었으나, 국사편찬위원회에서 1979년부터 작업해 온 ‘조선왕조실록 분류사(分類史) 편찬 자료’를 제공함으로써 이 데이터베이스는 자연어 색인뿐 아니라 161개 분류 주제에 의한 통제어 색인을 더 갖추게 되었다. 단, 국사편찬위원회의 색인은 태조～성종 부분만 교정을 마친 상태였고 연산군～철종에 해당하는 부분은 아직까지 초고 상태에 있었기 때문에 이번 국역 실록 CD-ROM은 성종까지의 분류 색인만을 포함하게 되었다. 나머지 철종까지의 분류 색인은 본 연구소에서 정리 작업을 수행하여 다음 번 버전에 반영할 계획이다. 정보 검색을 위한 색인 구성의 가장 이상적인 형태는 자연어 색인과 통제어 색인이 함께 구비되어 상호 보완적인 역할을 하는 것이다. 국사편찬위원회의 분류 색인으로 인해 국역 조선왕조실록 데이터베이스 수준은 한 단계 더 높아졌다고 할 수 있다.

《국역 조선왕조실록》의 방대한 정보량을 생각하면, 그것을 입력하여 단순히 종이에 찍어내는 일만 해도 엄청난 과업이 아닐 수 없다. 하지만 이 개발 사업의 목표는 처음부터 그러한 수준에 그치는 것이 아니었다. 컴퓨터 시스템에 대한 이해가 전혀 없는 초보자라 할지라도 기본적인 조작으로 《조선왕조실록》의 어느 구석에 숨은 정보든 한 순간에 찾아내고 또 그것을 즉시 인쇄하거나 개인용 워드프로세로 옮겨 자유롭게 편집할 수 있도록 하자는 것이 개발진이 의도한 시스템 기능의 하한선이었다. 조선왕조실록 CD-ROM이 포함하고 있는 정보의 양의 방대한 것 만큼, 그 정보를 효과적으로 찾아내고 정리하는 기능도 정보의 규모에 걸맞도록 다양하게 개발되었다. 개발진들은 그러한 기능 한 가지를 넣고 빼는 데 숱한 조사와 협의의 과정을 거쳤으며, 그 과정에서 정보 공학 분야의 이론 연구 뿐 아니라 우수한 해외의 정보 시스템의 기능들을 분석하여 적어도 실록 CD-ROM에 필요한 부분에 대해서만큼은 기존의 어떤 시스템보다도 우수한 것을 만든다는 자세로 개발에 임하였다. 물론, 이 시스템은 아직도 많은 면에서 미비한 점을 안고 있다. 그러나 현재의 시스템이 제공하는 기능만으로 사용자들은 수많은 유용한 정보를 편리하게 캐낼 수 있을 것으로 기대한다.

2. 조선왕조실록 데이터베이스의 발전 방향

《국역 조선왕조실록 CD-ROM》을 개발하는 동안 필자를 비롯한 개발진들은 전혀 이질적인 것으로 간주되어 온 고전 자료와 정보 기술을 접목시키는 데 필요한 여러가지 과제들을 그 어느것도 소홀히 하지 않고 최선을 다해 해결하려 했던 것만큼은 자부할 수 있을 듯하다. 하지만 그렇다고 해서 지금 만들어진 《국역 조선왕조실록 CD-ROM》 제1판이 국학 자료 전산화의 이상적인 모습을 구현한 것이라고 자신할 수 있는 것은 아니다. 그 속에는 아직도 많은 미비점이 있는 것이 사실이다. 시스템 개발을 종료한 시점에 개발진들은 이미 차기 버젼에서 개선하거나 새로 구현해야 할 것에 대한 수십 가지 목록을 작성하였다. 우리는 1년 단위로 《국역 조선왕조실록 CD-ROM》의 새로운 버전을 개발할 계획을 가지고 있다. 시스템의 기능 개선 뿐 아니라, 2억자나 되는 본문의 구석 구석에 아직도 숨어 있을 여러가지 종류의 데이타 오류를 수정하는 작업을 진행할 것이다. 아울러 다양한 분야에서 실록 CD-ROM을 사용하는 분들 중 데이타와 프로그램의 문제점을 지적해 주실 모니터링 요원을 위촉하여 개발진들이 미처 발견하지 못한 못한 부분들을 보완해 나아갈 예정이다. 《국역 조선왕조실록 CD-ROM》의 간행이 공론화 되었을 때, 많은 분들이 원천 자료의 오류 부분에 대한 염려를 토로하였다. 자료가 완벽하지 못한데 어떻게 만인에게 공개되는 CD-ROM으로 간행할 수 있겠느냐는 것이었다. 그렇게 말씀하시는 분들의 학자적 양식에는 고개가 수그려지지만 그것은 분명 순서가 뒤바뀐 이야기이다. 자료는 만인에게 공개되기 이전에 결코 완벽해질 수 없다. 400권이 넘는 책을 몇 사람의 교열자가 일일이 읽어 가면서 고치는 방식으로는 우리 세대가 다 지날 때까지도 완벽한 수정본이 나오리라고 장담할 수가 없다. 반면, 수천만개의 어휘들 중 어떠한 것도 순간적으로 찾아내는 실록 데이터베이스 시스템은 자료상의 오류를 고치는 일에 있어 종이 매체와는 비교할 수 없는 능률을 안겨 줄 것이다.

《조선왕조실록》 데이터베이스는 여건이 조성되는대로 인터넷과 같은 온라인 네트워크상에서 연구자 누구나가 조회할 수 있고, 자신의 연구 내용을 연구 자료 화일에 첨가할 수도 있는 쌍방향 정보 데이터베이스로 발전시켜 갈 예정이다. 우리나라 고전 연구의 활성화를 위해서는 《조선왕조실록》뿐 아니라 모든 유용한 고전 자료들이 같은 방향으로 데이터베이스화 되고 또 네트워크를 통해 공유화되어야 할 것임은 재론의 여지가 없다. 그렇게 될 경우, 고전을 연구하는 전문 연구자는 물론 인접 학문 분야 및 우리 전퉁 문화에 관심을 갖는 일반인들까지도 자신이 필요로 하는 정보를 마음대로 캐낼 수 있는 길이 열리게 될 것이다. 또한 학계의 연구 성과를 정리하고자 하는 사람도 몇 달에 걸쳐 도서관 목록실을 뒤지는 수고 없이 일목요연한 연구 성과물 목록을 얻어낼 수 있을 것이다. 또 이에 관련된 연구를 행한 낸 연구자들에 대해서는 이 데이터베이스의 존재가 곧바로 그들의 연구 실적 증명이 될 수 있을 것이다.

조선왕조실록 데이터베이스의 향방을 논함에 있어 빼놓을 수 없는 것은 한문 원전 실록의 전산화 문제이다. 앞에서 언급한 대로 서울시스템에서는 1992년부터 국역 실록의 전산화와 함께 한문 원전 조선왕조실록의 전산화를 기획하였고 또 현재까지 그 사업을 상당 부분 진척시켜 왔으나 원전 자료 정리의 부담으로 인해 이 사업이 최종 결실을 보기까지는 앞으로도 3～4년 정도의 기간이 더 필요할 것으로 예상된다. 당초 이 데이터베이스의 개발 계획을 수립할 때, 가장 쟁점이 되었던 문제는 한문 원문만을 입력할 것인지 표점(標點)을 가할 것인지 하는 것이었다. 이용자들에게 단순히 찾고자 하는 자료가 원전 실록의 어느 부분에 있는지를 알려 주는 것만을 목적으로 한다면, 막대한 시간과 인력이 소요되는 이 작업을 데이터베이스 구축 사업 범위에 포함시키지 않았을 것이다. 그러나 이 데이터베이스의 정보는 향후 조선왕조실록 연구의 기본 텍스트로 발전되어야 한다는 생각에서 자료의 표점 원칙을 정하였다. 조선왕조실록 원문의 많은 부분이 여러 연구자들의 연구 과정에서 심도 있게 분석되어 왔지만, 그 노력의 일부만이 논문 또는 저술로서 공개되고 있을 뿐이다. 이 시간에도 조선사를 연구하는 젊은 학도들은 선배 연구자들이 수십번도 더 읽었을 구절에 대해 다시 새로 구두점을 찍느라고 고생하고 있을지도 모를 일이다. 선배 연구자들이 행한 자료 분석의 노력이 후학들에 의해서 단순반복되지 않고 좀더 발전적으로 전개될 수 있도록 하자는 것이 원전의 표점 작업을 시행하게 된 동기이다.

한문 원전의 표점 방식은 중국에서 이십오사(二十五史) 표점본을 간행할 때에 적용한 규칙을 준용하였는데, 이십오사에서는 혼용되었던 지명과 인명을 구분하여 표시하도록 하였다. ‘국역 조선왕조실록 데이터베이스’가 세종대왕기념사업회와 민족문화추진회의 국역 실록을 저본으로 하여 개발되었듯이 ‘원전 조선왕조실록 데이터베이스’는 국사편찬위원회의 표점본을 저본으로 삼고 있다. 그러나 60년대에 국사편찬위원회에서 간행한 표점 영인 《조선왕조실록》에는 구두 표시만 되어 있기 때문에 이십오사 방식의 표점을 부가하는 작업이 현재 국사편찬위원회의 주관하에 진행되고 있다.

현재까지 원전 조선왕조실록 전산화의 진행 정도는 자료 입력에 있어서 태조에서부터 인조(영인본 1집～35집)까지의 데이타가 입력되었고 표점 업무는 태조에서 세종(영인본 1집～6집)까지가 서울시스템의 표점 연구 팀에 의해 진행되었으며, 연산군에서부터 중종 31년(영인본 12집～17집)까지의 자료가 금년 말까지 국사편찬위원회 고중세사실 연구 팀에 의해 이루어질 예정이다. 작업의 진행 방식은 서울시스템에서 원문 데이타를 입력한 후 1차 대조 교정을 거처 국편에 제공하면 국편에서 2차 대조 교정, 표점, 3차 교정의 작업을 차례로 진행하여 그 결과물을 서울시스템에 되돌려 데이터베이스에 적재하는 형태로 진행하고 있다. 서울시스템에서는 입력작업을 95년 12월말까지 모두 완료할 예정이며, 국사편찬위원회에서는 98년 말까지 원전 실록 전체에 대한 표점 작업을 마칠 수 있을 것으로 예상하고 있다. 이와 같은 기초 작업이 완료되게 되면 코드 및 서체 보완 작업과 데이터베이스 운영 시스템의 보완 작업, 데이타에 대한 최종 감수 과정 등을 거쳐 1999년 까지는 한문 원전 조선왕조실록 데이터베이스의 출간이 가능할 것으로 전망된다. 원전 조선왕조실록 데이터베이스는 CD-ROM 간행과 함께 책자로도 간행할 계획이며, 이 역시 궁극적으로 온라인 데이터베이스화 되어 국내외의 연구자들에게 제공될 것이다.

한문 원전 실록 데이터베이스 역시 국역 실록의 경우와 마찬가지로 초판부터 그 완성도를 자신있게 주장할 수는 없을 것이다. 그렇지만 그 데이터베이스가 일단 그 골격을 갖추어 학계에서 활용되기 시작하면 소수의 편집자가 아니라 학계의 모든 연구 인력들에 의해서 보다 심화된 연구에 기초한 정확한 표점이 가해질 것이며, 또 이러한 작업은 국역 실록의 오류도 정정하여 보다 완벽한 번역문을 만들어 내는 데 일조를 할 것이다. 한문 원전 실록이 데이터베이스화되었을 경우 그것은 국역문의 경우와 마찬가지로 자료의 모든 부분에 대해서 검색이 가능하고 또 검색된 결과를 다양하게 활용할 수 있게 하는 기능들이 제공될 것이다. 연구자들은 표점 내용을 참조하기 위해서뿐 아니라 집필 도중 한문 원문을 타이핑하는 수고를 줄이기 위해서라도 이 데이터베이스를 쓸 필요가 있을 것이다. 그리고 그 사이에 자연스럽게 기존 표점과 자신의 해석 사이에 상이점이 있음을 발견하게 되면, 그 내용을 데이터베이스 관리자에게 정보로 제공하여 보다 완전한 텍스트를 만들어 나아갈 수 있을 것이다.

3. 《조선왕조실록》 데이터베이스 개발 사업의 의의

《조선왕조실록》의 전화화와 CD-ROM 간행 사업이 갖는 의의는 여러 각도에서 설명될 수 있을 것이다. 조선시대사 연구자들에게 획기적인 연구 능률의 향상을 안겨 준다든가, 사회과학과 같은 인접학문의 종사자들에게도 우리 사료를 손쉽게 접근할 수 있는 길을 열어 학제간 연구의 가능성을 높였다든가, 일반인들에게도 전통 문화의 풍성하고 가치 있는 면모를 쉽게 보여줄 수 있게 되었다든가 하는 .... 그 모두가 다 중요한 이야기들이다. 지난 3년간 《조선왕조실록 CD-ROM》 간행 사업을 추진해 온 서울시스템 한국학데이터베이스연구소의 개발진들은 이 사업에 그와 같은 의미를 부여하며 여러가지 어려움을 감내해 왔다. 그러나 우리가 이 일에 혼신을 다해 매달려 온 데에는 또 다른 이유가 있었다. 바로 지금 고전자료와 정보기술 사이에 서로 교통할 수 있는 통로를 만들어 놓지 않으면, 그 길을 뚫기가 날이 갈수록 어려워지리라고 하는 절박한 심정이 그것이다.

과학 기술에 대해 일반인들이 가지고 있는 막연한 환상 중의 하나는 그것이 발달할수록 그 혜택의 범위도 광범위하게 넓어지리라고 기대하는 것이다. 틀린 생각이라고는 할 수 없지만 그렇지 않은 예외의 경우도 결코 적지 않다. 기술의 발달과 더불어 더욱 풍요로와지는 분야가 있는가 하면, 그 혜택의 범위에서 소외되어 상대적으로 더욱 빈곤해지는 분야도 있다. 새로운 기술의 개발이나 그 기술을 적용한 응용 상품의 생산에는 일반인들로서는 상상하기도 어려운 규모의 자금이 투여된다. 그 기술이 고도의 첨단 기술일수록 개발 비용이 커질 수밖에 없다. 개발자는 당연히 개발비의 회수 가능성을 좇아 투자 대상을 결정할 것이다. 상업성이 없는 분야의 일들은 어쩔수없이 첨단 기술의 수혜 범위 밖에 놓이게 된다. 기술과 자본이 지속적으로 투여되는 분야에서는 기술혁신이 이루어져 생산성이 높아지고 그 결과 점차 비용을 줄이면서도 큰 성과를 얻는 일이 가능해진다. 하지만 처음부터 자본과 기술이 발을 들여놓지 않았던 분야에서는 시간이 지날수록 발달된 기술의 도입이 어려워진다. 이른바 상업성이라고 하는 요인이 기술의 발달에 따른 ‘부익부, 빈익빈(富益富, 貧益貧)’의 현상을 가속화시키고 있는 것이다.

고전 자료를 다루는 한국학 분야의 여러 학문들은 성격상 방대한 문헌 자료를 조사하고 정리하는 일이 필수적임에도 불구하고 그러한 일들을 효과적으로 처리해 줄 수 있는 컴퓨터 시스템의 혜택 범위에서 오랫동안 소외되어 왔던 것이 사실이다. 한국학 연구에 종사하시는 분들은 아마도 세월이 흐른 뒤에는 이 분야의 자료들로 대부분 저절로 전산화가 되겠거니 생각하실지도 모른다. 그것은 명백히 틀린 생각이다. 컴퓨터 관련 기술은 하루가 다르게 발전하고 있지만, 그 발달된 기술이 적용되는 곳은 투자의 효과가 즉각적으로 드러나는, 지극히 상업적인 분야로 국한되어 가고 있다. 무엇인가 특별한 계기가 마련되어 소외된 이 분야에 기술과 자본의 비를 인위적으로 뿌리지 않는 한, 한국학과 정보과학기술은 점점 더 만나기 힘든 거리로 멀어져만 갈 것이 분명한 현실인 것이다.

필자가 개인적으로 생각하는 조선왕조실록 데이터베이스 개발의 또다른 의의는 시간이 흐를수록 멀어져만 가던 첨단 정보기술과 고전 학술자료를 가까스로 끌어당겨 하나로 묶어 내었다고 하는 점이다. 이 점에서 있어서 조선왕조실록 데이터베이스의 개발은 그 사업 자체의 의의보다도 앞으로 이와 유사한 사업을 계속 전개할 수 있는 가능성을 열었다는 점에서 더욱 주목받아야 할 것이라고 생각한다. 고전 자료의 전산화에 대한 논의가 단지 당위로서 언급될 때와 구체적인 성과물로서 제시될 때의 상황은 같지 않다. 필자는 《조선왕조실록 CD-ROM》 개발이라는 이 성과가 정부나 기업 학계 모두에게 고전 자료 전산화 사업이 결과를 기대할 수 없는 허상이 아님을 보여줄 수 있게 되었다는 데에 가장 큰 의미를 두고 있다. 첨단 정보 기술과 고전 자료 사이의 거리가 결코 가깝지 않은 것이 사실이지만 진정으로 그 양자의 접목이 중요하다고 여기는 사람들이 필요한 만큼의 투자를 하면 그것을 실현시킬 수도 있다고 하는 가능성의 입증을 중요하게 여기는 것이다.

《조선왕조실록》 데이터베이스 개발에서 얻어진 또 하나의 실질적인 성과는 이제부터 이루어질 다른 고전 자료 전산화의 비용이 조선왕조실록 데이터베이스의 개발 비용과는 비교가 되지 않을 정도로 절감될 것이라고 하는 점이다. 소프트웨어 개발 사업의 특수한 면모 중의 하나는 동종의 소프트웨를 지속적으로 개발할 경우 초기 개발에는 막대한 비용이 소요되나 후속 개발에는 그것이 크게 절감된다고 하는 하는 점이다. 서울시스템 데이터베이스사업부에서는 초기 개발 후 1 년 안에 동종의 새로운 시스템을 개발할 경우 후자의 개발 비용은 전자의 1/3 수준으로 산정하고 있다. 기개발된 요소 기술의 재활용이 가능하기 때문이다. 조선왕조실록 데이터베이스의 개발 사업은 고전 자료 전산화에 필수적인 여러가지 요소 기술을 부산물로 남겼다. 이는 바로 정보 기술과 고전 자료 사이의 거리가 그만큼 좁혀졌다는 얘기가 된다. 앞으로 고전 자료 데이터베이스 개발 사업이 진행되면 될수록 그 거리는 더욱 좁아질 것이다. 반면, 고전 자료 전산화 사업이 이 한 가지에 머문 채 다시 몇 년의 세월이 지나갈 경우 양자의 거리는 다시 붙들어매기 어려울 정도로 멀어질 것도 분명한 사실이다.

4. 고전 자료 전산화 사업 추진에 관한 제언

끝으로 우리나라의 연구 기관들과 교육 행정 담당자들은 《조선왕조실록》과 같은 고전 자료의 전산화 사업을 어떠한 시각을 가지고 이끌어 나아가야 할 것인가에 관해 필자의 소견을 제안하고자 한다. 학술 자료 전산화 사업이 한 두 번의 시험적 시행에 그치지 않고 진정으로 우리나라 학술 진흥의 요목이 될 수 있도록 하기 위해서는 그것의 성격을 어떻게 정립해 나아가야 할 것인가 하는 문제이다. 고전 자료의 전산화가 단순히 원문이나 번역문을 입력하여 연구자들에게 참고 자료를 제공하는 식으로만 전개된다면 그것의 효용성에는 한계가 있기 마련이고, 그렇게 되면 전산화의 필수 요건인 지속적인 개발 투자의 동기도 퇴색될 가능성이 높다. 고전 자료 전산화 사업은 단순히 연구자들에 대한 참고자료 제공의 성격을 넘어서 고전에 대한 연구와 그 보급을 촉진시키는 제도적 장치에 응용되는 수준으로까지 발전되어야 한다.

고전 자료 데이터베이스가 어떻게 학술 진흥의 제도적 장치의 역할을 할 수 있겠는가 하는 물음에 답하기 위한 유비(類比)로서, 요즈음 우리나라 교육계의 논란거리가 되고 있는 교수평가제라고 하는 문제를 전산화 문제와 엮어서 생각해 보기로 한다. 대학 교원의 자질과 교육의 수준을 높이기 위해 제안된 교수평가제는 그 객관성을 도모하기 위한 여러가지 방안들이 고안되어 있지만 그 중 비중이 가장 높은 항목은 ‘논문을 얼마나 썼느냐’하는 것이다. 대학 교수의 첫번째 과제가 연구 활동이고 논문은 그 연구 활동의 결과이니, 논문을 통해 실적을 평가하는 것은 당연한 일이다. 그러나 문제는 그 평가가 논문의 질을 고려하기보다는 양만을 따지는 경향을 띠고 있다는 것이다. 논문에 담긴 내용의 학술적 가치를 엄밀히 드러내지 못한 채, 편수만을 센다면 그 결과가 어떠한 방향으로 흐르리라는 것은 자명하다. 겉으로만 연구 논문의 모양을 취한 질낮은 논문이 범람하여 옥석을 구분하는 일이 점차 어렵게 될 것이며, 교수들은 그 논문의 편수를 채우는 부담으로 인해 정작 깊이 있는 연구의 기회를 잃게 될지도 모를 일이다. 양에 대한 평가가 질에 대한 평가로 바뀌어야 함은 재론의 여지가 없다. 그러나 이 경우에는 또다른 난제가 있다. 도대체 어떠한 방법으로 그 질의 높낮이를 가릴 수 있겠느냐 하는 것이다. 교수들의 연구 논문은 양보다는 그 질을 가지고 평가를 해야 하되, 그 평가의 결과가 객관적인 수치로 드러날 수 있는 정량적인 방법이 도입되어야 한다. 필자는 이를 위한 한 가지 방법으로 사이테이션 인덱스(citation index: 인용 색인) 데이터베이스의 운영을 고려할 수 있다고 생각한다.

‘사이테이션 인덱스’, 즉 ‘인용 색인’이란 어느 논문이 다른 어느 논문에 인용되었는가를 조사하여 기록한 데이터베이스이다. 논문이나 보고서와 같은 연구 결과들은 어느것도 그 자체로 최종적인 완성품이 될 수 없으며, 보다 발전된 연구의 밑거름이 되어야 한다. 여러 연구자들에 의해서 폭넓게 그리고 심도 있게 인용되는 되는 논문은 이미 객관적으로 그 질적 우수성이 입증된 논문이라고 인정해도 무방할 것이다. 반면, 아무에게도 인용되지 않는 논문은 집필자의 개인적 과제물 이상의 의미를 갖는다고 보기 어렵다. 인용 관계를 조사하여 그 기록을 누적시킨 사이테이션 인덱스 데이터베이스의 장점은 학계의 최고 권위자들을 심사위원으로 부르지 않고서도 학계 전반의 연구열을 토대로 가장 엄정한 객관적 평가를 도출할 수 있다는 것이다. 사이테이션 인덱스의 응용 범위는 연구 실적 평가 이외에도 무한히 넓혀질 수 있다. 학계의 연구 동향의 추이를 밝힐 수 있고 인접 학문 분야 내지는 외국 학계와의 영향력 수수 관계도 살필 수 있다. 어느 학술지가 해당 분야의 가장 권위있는 학술지인지도 자명하게 드러날 것이다. 많이 인용되는 논문은 많이 게재한 학술지가 가장 권위있는 학술지로 인정될 수 있음은 물론이다.

필자가 이 자리에서 사이테이션 데이터베이스에 대해 언급한 이유는 그것이 단순히 연구자 개개인의 연구 활동을 돕는 참고자료의 역할을 하는 데 그치는 것이 아니라 학계 전반의 연구 생산성을 증진시키는 제도적 장치에도 응용될 수 있기 때문이다. 필자는 고전 자료 데이터베이스 역시 그와 같은 기능을 담당해야 한다고 생각한다.

국역 조선왕조실록의 데이터베이스의 개발에 이어 한문 표점 실록 데이터베이스를 개발하는 목적은 일차적으로 한국학 연구자들에게 편리하게 이용할 수 있는 연구 자료를 제공한다는 데에 있지만, 필자는 이들 데이터베이스가 단순히 그와 같은 참고자료의 제공 기능에 머물지 않기를 기대한다. 조선왕조실록 데이터베이스가 널리 활용되어질수록 그 효용성 내지는 편리성에 대한 인식도 높아가겠지만, 반면 그것이 포함하고 있는 오류나 미비점도 더욱 분명하게 드러나 곳곳의 잘못이 지적되고 그 정정이 요구될 것이다. 그뿐 아니라 사료에 대한 종합적인 검증이 가능해짐으로써 현재까지의 학설과는 다른 새로운 역사 해석이 창출될 가능성도 있다. 그때부터는 번역과 자료 가공의 오류 지적 및 새로운 역사 해석 등을 제시한 학설들이 이 데이터베이스의 각 레코드와 논리적으로 연결된 연구 자료 파일에 첨가되는 작업이 이루어져야 한다. 현재의 조선왕조실록 데이터베이스는 단일 텍스트의 자료 구조를 이루고 있지만, 앞으로는 이 자료 이용의 결과로 산출되는 수많은 피드백이 수집 정리됨으로써 이른바 하이퍼 텍스트(hyper text) 구조의 데이터베이스가 되어야 한다는 것이다. 《조선왕조실록》의 텍스트와 함께 그에 대한 여러가지 연구 성과들을 하이퍼 텍스트 구조로 역은 데이터베이스 상에서는 텍스트에서부터 출발하여 그에 관련 연구물로의 접근이 가능하며, 또 역으로 논문 초록이나 논저 목록을 출발점으로하여 거기에 인용되거나 반론이 제기된 텍스트로의 접근이 이루어질 수 있게 된다. 이러한 하이퍼 텍스트 데이터베이스는 역사학은 물론 인접 학문 분야의 연구자들에게 대해 더욱 풍성한 자료 제공의 역할을 할 것은 물론 《조선왕조실록》을 둘러싼 학계의 최신 연구 성과와 그것이 도달한 수준을 여실히 드러내 줄 수 있을 것이다. 누가 무엇에 대한 연구를 얼마나 깊이 있게 했느냐, 학계의 연구가 주로 어느 부분에 집중되어 있으며, 어느 부분의 연구가 아직도 취약하냐 하는 것도 이 종합적인 데이터베이스를 통해 살필 수 있는 정보가 될 것이다.

고전 자료 전산화 사업에 관한 이 제언의 요지는 전산화의 목적이 단순히 레퍼런스(reference)를 제공하는 데 그치는 것이 아니라, 학계의 연구 현황을 제대로 알려 주고 그 진흥을 촉진하는 바로미터의 역할을 하게 하자는 것이다. 고전 자료의 전산화에 관해 우리가 이와 같은 장기적 비젼을 갖고 적극적으로 그 일을 추진해 나아가는 경우에만 정부나 기업도 그들이 가진 것을 내놓아 이 사업의 실현을 도울 것이다.

여태까지 고전 자료의 전산화라는 문제가 그 올바른 해결 방안을 찾지 못한 이유는 정부의 무관심이나 산업계의 홀대보다도 연구자들의 잘못된 이해에 있다고 해도 틀린 말은 아닐 것이다. 연구자가 자기 워드프로세서에 어느 고전 자료의 한문 원문을 입력해 넣는 것은 개인적인 연구에는 필요한 일이겠지만, 그러한 일들이 고전 자료 전산화의 전부인 것처럼 이해되어서는 곤란한다. 고전 연구자들이 고전 자료의 전산화를 위해 해야 할 일은 한자를 타이핑하는 일이 아니다. 자료 입력은 능률적인 기계장치와 훈련받은 오퍼레이터에 의해 훨씬 더 신속하고 정확하게 수행될 수 있다. 고전 연구자들은 그들의 전문적인 지식과 소중한 시간을 입력 자료의 검증이나 자료 간의 연관성을 부여하는 일, 그리고 수집된 정보를 평가하는 일에 써야 한다. 또한 데이터베이스의 구축을 위해 필수적인 자료 구조 설계나 색인법의 구현, 유저 인터페이스의 설계 등은 정보공학 분야의 전문가에게 맡겨야 할 일이다. 이들의 협력을 구하지 않고 고전 자료를 전산화하겠다고 하는 것은 마치 컴퓨터 기술자들이 고전 연구자들의 도움 없이 단독으로 고전 자료 데이터베이스를 만들겠다고 하는 것과 똑같은 잘못을 저지르는 것이다. 요컨대, 제대로 된 고전 자료 데이터베이스를 만들기 위해서는 고전 연구자들을 위시해서 고도의 기술력을 지닌 정보 기술 인력과 훈련된 자료 가공 요원을 포함하는 조직을 구성하여 명확한 목표 하에 개발 프로젝트를 수행해야 한다. 그리고 데이터베이스 개발 이후에도 학계의 최신 연구 성과를 수집하여 그 정보를 계속 유지 보완함으로써 데이터베이스의 활용성을 증대시켜 가는 일이 필요한데 그것은 고전 자료에 대한 소양을 토대로 그것을 정보화하는 방법을 습득한 데이터베이스 관리 인력이 있음으로써 가능한 일이다.

이런 식으로 일을 진행하기 위해서는 무엇보다도 그 인력들에 대한 인건비와 하드웨어 도입 및 소프트웨어 개발에 소요되는 비용이 마련되어야 할 것이다. 이 점은 아마도 고전 연구 관계자들이 가장 자신 없어 하는 부분임에 틀림없다. 고전 연구자들이 스스로 그 비용을 염출하는 것은 가능한 일도 아니거니와 또 요구되어질 수도 없는 일이다. 학술 데이터베이스의 구축은 우리나라의 학술 진흥을 위한 기간 시설의 구축이라는 의미를 갖는 사업이다. 앞에서도 언급하였듯이 이것은 단지 연구자에게 풍부한 참고 자료를 제공한다는 의미 이외에도 우리 학계의 학문 수준을 객관적으로 드러냄으로써 미흡한 부분을 보완하며 비정상적인 요소들을 척결하게 하는 학술 진흥의 촉진체 구실을 하는 것이다. 산업 발전을 위해 항만과 도로를 건설하는 것이 정부의 몫이듯이 이 문제 역시 공공사업의 차원에서 그 해결 방안이 모색되어야 한다. 단, 그 구체적인 해결 방안을 찾는 데 있어서 고전 연구자들이나 연구 기관이 교육부의 예산 탓만 하는 것은 올바른 방향이 아님을 지적하고자 한다. 어떻게 보면 정부에서는 이미 그 예산을 마련해 놓고 있다고도 할 수 있다. 대한민국 정부는 현재 정보산업 발전을 위해 미국이나 일본에서도 그 유례를 찾아 볼 수 없는 국가적 지원 시책을 펴 나아가고 있다. 2015년까지 우리나라의 초고속 정보통신망 구축 사업을 위해 책정된 예산은 무려 45조원에 이른다. 그리고 그 예산의 일부로서 운영되는 ‘공공 서비스 응용 시스템 개발 사업’은 금년에 이미 160억원을 ‘학술자료 화상 서비스’를 비롯한 23종의 공익 데이터베이스 개발비로 집행하였으며, 매년 그 예산은 크게 증액될 전망이다. 한국학 고전 자료 데이터베이스의 구축이 정보화 시대의 균형있는 학술 진흥을 위해 꼭 필요한 사업임을 정부 당국에 납득시켜 그 예산을 확보하고 사업을 추진하는 것은 민족문화추진회와 같은 고전 연구 기관에게 주어진 과제일 것이다.

<부록> 《CD-ROM 국역 조선왕조실록》 범례

1. 《CD-ROM 국역 조선왕조실록》은 세종대왕기념사업회와 민족문화추진회에서 1968년부터 1993년까지 국역한 《조선왕조실록》을 저본으로 하여 구축한 데이터베이스 CD-ROM이다. 데이터베이스 구축을 위해 저본의 내용에 대해 아래와 같이 첨삭을 가하거나 체제 및 기호를 통일하였다. 또한 1993년 이후 두 기관에서 수행한 검토 작업 결과도 추가 반영하였다.

2. 《CD-ROM 국역 조선왕조실록》 제1집(태조～성종)에는 국사편찬위원회의 ‘《조선왕조실록》 분류사 편찬 자료’ 데이타를 반영하여 색인(索引)할 수 있도록 하였다. 또한 각 기사의 끝부분에 해당 기사의 《조선왕조실록》 원전(原典:국사편찬위원회 영인본)의 면수(面數)와 항목 분류 정보를 부기(附記)하여 사용자의 편의를 도왔다.

3. 《CD-ROM 국역 조선왕조실록》은 연대기(年代記) 자료인 《조선왕조실록》을 중층 구조(重層構造)로 데이터베이스하여, 한 기사의 앞 뒤 기사를 바로 찾아볼 수 있도록 했을 뿐만 아니라 달[月]-년(年)- 왕대(王代)간의 이동 및 접근도 자유롭게 하였다.

4. 《세종실록》 오례(五禮)에 실려 있는 각종 그림과 도표 자료도 데이터베이스하여, 각 그림과 도표를 열람할 수 있을 뿐만 아니라 ‘그림 관련 기사 보기’를 통하여 관련 텍스트와도 자유롭게 이동할 수 있도록 하였다.

5. 국역본 413권 중 《세종실록》 23권과 28권은 각각 악보(樂譜)의 한문(漢文) 원전(原典)과 칠정산(七政算)의 한문 원전이므로 수록 대상에서 제외하였다. 또한 《세종실록》 22권 악보와 26권 칠정산 내편(內篇), 27권 칠정산 외편(外篇)도 이번 판에서 보류되었다.

6. 각 실록의 명칭은 약칭(略稱)을 원칙으로 한 후기 국역의 범례를 따라 《태조실록》․《정종실록》 등으로 칭했고, 기사제목을 표기할 때는 태조․정종․선수(《선조수정실록》)․현개(《현종개수실록》)․숙보(《숙종실록보궐정오》)․경수(《경종수정실록》) 등으로 약칭하였다.

7. 《숙종실록》의 경우 원전과 국역본 모두 《숙종실록》 제1권, 《숙종실록보궐정오》 제1권, 《숙종실록》 제2권, 《숙종실록보궐정오》 제2권의 체제로 되어 있으나, 다른 수정실록과 체제를 통일하여 《숙종실록》과 《숙종실록보궐정오》로 각각 나누어 편집하였다.

8. 총서(總書)와 부록(附錄)의 체제는 다음과 같이 통일하였다.

① 총서(總書)

가. 왕의 출생, 성격, 일화(逸話), 즉위에 관련된 내용 등을 포함하는 각 실록 첫머리의 일진(日辰) 표시 없이 작성된 기사를 총서로 하였다.

나. 국역본 총서에 포함된 내용 중, 명백하게 연대기로 분류되어야 할 기사는 일진을 참조하여 날짜를 복원한 후 연대기에 포함시켰다.

다. 국역본에는 연대기에 포함되어 있으나, 내용상 명확히 총서로 분류되는 것은 총서로 추출하였다.

② 부록(附錄)

가. 기본적으로 국역본에 부록으로 분류되어 있는 것을 그대로 따랐다. 왕의 전기 자료(傳記資料), 즉 시책문(諡冊文)․애책문(哀冊文)․묘지문(墓誌文)․행장(行狀) 등과 편수관(編修官) 명단 등을 그 내용으로 한다.

나. 국역본에는 연대기에 포함되어 있으나, 내용상 부록에 해당하는 것은 원 체제를 크게 해치지 않는 범위 내에서 부록으로 처리하였다.

9. 원전 및 국역본의 ○표를 한 기사로 하여, 각 기사마다 그 기사 내용을 축약 표현한 기사제목을 작성함으로써 검색․열람시 내용 파악을 용이하게 하였다. 또한 기사제목 안의 단어들은 검색 접근점으로도 쓰일 수 있게 하였다.

10. 국역본의 ○표를 한 기사로 처리하되, 한 기사의 길이가 원고지 100매 분량이 넘는 경우, 열람의 편의를 위하여 기사를 분할하고 해당 기사제목 뒤에 ①②③ 등의 번호를 달았다.

11. 사용자 편의를 위하여 본문의 원주․역주 등에 색상을 부여하여 쉽게 구별되도록 하였다. 그 색상의 종류와 내용은 다음과 같다.

① 【회 색】: 《조선왕조실록》 원전 편찬 당시 편수관이 달아 둔 원주(原註)를 표시한다.

② 【파란색】: 국역자(國譯者)가 단 역주(譯註)의 해당어를 표시한다. 이 부분을 클릭하면 역주를 볼 수 있다. 단 역주 해당어가 너무 긴 경우에는 편의상 일부분만을 해당어로 처리하였다.

③ 【연두색】: 국사편찬위원회의 《조선왕조실록》 항목 분류 정보 및 원전의 면수를 표시한다. 《세종실록》오례(五禮)편에서는 삽도(揷圖)의 제목을 표시한다.

④ 【분홍색】: ‘사신왈(史臣曰)’에 해당하는 사신의 논평(論評) 부분을 표시한다.

⑤ 【하늘색】: 판본(版本)에 이동(異同)이 있는 《광해군일기》의 경우, 대본(臺本)인 중초본(中草本)과 차이가 있는 정초본(正草本)의 내용을 표시한다. 【하늘색】 앞에 있는 < > 표시는 < > 내용이 【하늘색】으로 첨삭(添削)되었음을 말하고, 【하늘색】만 있는 경우는 【하늘색】 내용이 보첨(補添)되었음을 말한다.(《CD-ROM 국역 조선왕조실록》 제2집 《광해군일기》 해제 참조)

⑥ 【빨간색】: 검색 결과를 보여 줄 때, 사용자가 검색 질의어로 준 단어를 표시한다.

12. 정확한 검색을 위해 인명(人名)의 성(姓)과 이름은 붙여 썼으며, 이름만 표기되어 있는 기사의 경우 성(姓)을 복원해 주는 것을 원칙으로 하였다. 종친의 이름에도 성을 복원하였다.

13. 맞춤법과 띄어쓰기는 ‘한글 맞춤법 통일안’을 따르는 것을 원칙으로 하되, 원활한 검색을 위하여 관직명(官職名)․관서명(官署名)․작호(爵號)․제도 용어 등의 고유 명사는 띄어쓰는 것을 원칙으로 하였다.

(예) 이조 판서(吏曹判書), 사역원 정(司譯院正), 노비 변정 도감(奴婢辨定都監), 안평 대군(安平大君), 경외 출송(京外出送)

단, 관직명이 관서명 앞 뒤로 나뉘어 표기된 경우와 작호가 한 글자인 경우는 붙여 썼다.

(예) 판의금부사(判義禁府事), 의안군(義安君)

14. 대화(對話)․운문(韻文)․전교(傳敎)․교서(敎書)․상소(上疏) 등을 별행으로 처리한 후기 국역의 범례를 따라《세종실록》 등도 위의 경우들을 별행으로 처리하였다. 또한 한 단락이 길 경우, 독자의 편의를 위하여 문단나누기를 하였다.

15. 이해를 돕기 위해 병기(倂記)한 한자(漢字)는 그대로 수록하되, 한시(漢詩) 원문은 삭제하였다.